Меню
Публикации
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор
НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
doi: 10.17586/2226-1494-2019-19-2-299-305
УДК 519.816
КРИТЕРИИ СООТВЕТСТВИЯ ТЕКСТА НАУЧНОМУ СТИЛЮ
Читать статью полностью
Язык статьи - русский
Ссылка для цитирования:
Аннотация
Ссылка для цитирования:
Блеес Э.И., Заславский М.М. Критерии соответствия текста научному стилю // Научно-технический вестник информационных технологий, механики и оптики. 2019. Т. 19. № 2. С. 299–305. doi: 10.17586/2226-1494-2019-19-2-299-305
Аннотация
Приведены результаты экспериментального исследования критериев соответствия текста научному стилю. Исследованы показатель повторений в текстовом документе ключевых слов и фраз, процентное соотношение стоп-слов и общего числа слов в тексте, отклонение графика частоты слов в тексте от идеального графика по Ципфу. Исследование проведено с применением сценария, проверяющего текст по нескольким критериям. В результате экспериментального исследования на выборке из 2500 статей, опубликованных в источниках ВАК/РИНЦ, получены распределения значений критериев, которые проверены на нормальность по нескольким критериям, а также на корреляцию между собой. В результате анализа этих данных получены и математически обоснованы пороговые значения критериев, которые применены на тестовой выборке, состоящей из бакалаврских работ студентов СПбГЭТУ «ЛЭТИ», псевдонаучной статьи «Корчеватель», технических статей из интернет-сообщества «Хабр», «Капитала» Карла Маркса и ряда текстов, не относящихся к научному стилю. Сформулировано необходимое, но не достаточное условие соответствия статьи научному стилю.
Ключевые слова: научный стиль, анализ текста, закон Ципфа, автоматизация рецензирования научных статей
Список литературы
Список литературы
-
Демидова А.К. Пособие по русскому языку: научный стиль, оформление научной работы. М.: Русский язык, 1991. 201 c.
-
Кириллова О.В. и др. Методические рекомендации по подготовке и оформлению научных статей в журналах, индексируемых в международных наукометрических базах данных. М.: АНРИ, 2017. 144 c.
-
Davis H. Search Engine Optimization. O'Reilly Media, 2006. 48 p.
-
Newman M.E.J. Power laws, Pareto distributions and Zipf's law // Contemporary Physics. 2005. V. 46. N 5. P. 323–351. doi: 10.1080/00107510500052444
-
Lelu A. Jean-Baptiste Estoup and the origins of Zipf's law: a stenographer with a scientific mind (1868-1950) // Boletín de Estadística e Investigación Operativa. 2014. V. 30. N 1. P. 66–77.
-
Блеес Э.И., Андросов В.Ю. Автоматизация процесса проверки текста на соответствие научному стилю // Современные технологии в теории и практике программирования: материалы научно-практической конференции студентов, аспирантов и молодых ученых. 2018. С. 118–121.
-
Dong X.L. et al. Knowledge-based trust: Estimating the trustworthiness of web sources // Proceedings of the VLDB Endowment. 2015. V. 8. N 9. P. 938–949.doi: 10.14778/2777598.2777603
-
Исполняемый сценарий, получающий выборку статей [Электронный ресурс]. Режим доступа: https://github.com/EduardBlees/Master-s-thesis/blob/master/script/leninka_scrapper.py, свободный (дата обращения: 20.12.2018).
-
Boeing G., Waddell P. New insights into rental housing markets across the United States: Web scraping and analyzing craigslist rental listings // Journal of Planning Education and Research. 2017. V. 37. N 4. P. 457–476.doi: 10.1177/0739456x16664789
-
Shapiro S.S., Wilk M.B. An analysis of variance test for normality (complete samples) // Biometrika. 1965. V. 52. N 3/4. P. 591–611. doi: 10.2307/2333709
-
Kolmogorov A. Sulla determinazione empirica di una lgge di distribuzione // Inst. Ital. Attuari. Giorn. 1933. V. 4. P. 83–91.
-
Anderson T.W., Darling D.A. Asymptotic theory of certain "goodness of fit" criteria based on stochastic processes // The Annals of Mathematical Statistics. 1952. V. 23. N 2. P. 193–212.doi: 10.1214/aoms/1177729437
-
Гмурман Б.Е. Теория вероятностей и математическая статистика. Москва: Высшаяшкола, 2003. 478 с.
-
Cumming G. Replication and p intervals: p values predict the future only vaguely, but confidence intervals do much better // Perspectives on Psychological Science. 2008. V. 3. N 4. P. 286–300. doi: 10.1111/j.1745-6924.2008.00079.x
-
Исполняемый сценарий, рассчитывающий математические критерии распределений [Электронный ресурс]. Режимдоступа: https://github.com/EduardBlees/Master-s-thesis/blob/ master/ script/results/testDistribution.py, свободный. Яз. англ. (дата обращения: 20.12.2018).
-
Sci Py Module for Python [Электронный ресурс]. Режим доступа: https://scipy.org, свободный. Яз. англ. (дата обращения: 20.12.2018).
-
Wheeler D.J. et al. Understanding Statistical Process Control. SPC Press, 1992. 406 p.
-
Easton V.J., McColl J.H. Statistics glossary [Электронный ресурс]. Режим доступа: https://stats.gla.ac.uk/steps/ glossary/ index.html, свободный. Яз. англ. (дата обращения: 20.12.2018).
-
Жуков М.С. Корчеватель: алгоритм типичной унификации точек доступа и избыточности [Электронный ресурс]. 2008. Режим доступа: https://e-lub.net/annuals/ratu.htm (дата обращения: 20.12.2018).
-
Stribling J., Aguayo D., Krohn M. Rooter: A methodology for the typical unification of access points and redundancy // Journal of Irreproducible Results. 2005. V. 49. N 3. P. 5.
-
Моё разочарование в софте [Электронный ресурс]. Режим доступа: habr.com/post/423889/, свободный. Яз. рус. (дата обращения:20.12.2018).
-
Наши с вами персональные данные ничего не стоят [Электронный ресурс]. Режим доступа: https://habr.com/post/423947/, свободный. Яз. рус. (дата обращения: 20.12.2018).
-
Рассказ о том, как я ворую номера кредиток и пароли у посетителей ваших сайтов [Электронный ресурс]. Режим доступа: https://habr.com/post/346442/, свободный. Яз. рус. (дата обращения: 20.12.2018).
-
Трехмерный движок на формулах Excel для чайников [Электронный ресурс]. Режим доступа: https://habr.com/post/353422/, свободный. Яз. рус. (дата обращения: 20.12.2018).